在前面的實作中,我們多半以 提示工程(Prompt Engineering) 為核心:撰寫 prompt、送入 LLM 取得回應,再將結果整合到應用服務中。這種模式雖能解決許多實務需求,但本質仍是「你問我答」的互動,模型缺乏主動性,也無法掌控更複雜的流程。
隨著應用情境愈趨複雜,我們開始期待 AI 不只是回覆,而能在接到任務後主動規劃步驟、挑選合適工具,甚至記住中間結果並持續調整。這正是 AI Agent 要解決的挑戰。從今天開始,我們將進入 Agent 的世界,一起學習如何設計具備自主思考、動態決策與任務執行能力的智能流程,讓 AI 從回答者進化為真正的任務執行者。
AI Agent 也稱為 Agentic AI,是一種能夠自主決策並採取行動的人工智慧系統。它的特點在於,不只是回答問題,而是能根據任務與環境,自行規劃步驟並執行。這讓它比傳統的 LLM 更接近「智慧助理」的角色。
AI Agent 的運作大致可以分成以下環節:
這樣的運作流程,讓 AI Agent 不再只是「你問我答」的聊天機器人,而是能主動判斷、持續改進,甚至在複雜情境下完成任務的智慧系統。
以下我們透過一張對照表,來比較傳統 LLM 與 AI Agent 在特性上的差異:
項目 | 傳統 LLM 應用 | AI Agent 應用 |
---|---|---|
啟動方式 | 被動回應使用者輸入 | 接收任務目標後主動規劃與執行 |
任務分解 | 需要開發者或使用者逐步引導 prompt | 可自行分析任務並拆解成子步驟 |
工具調用 | 工具使用需由開發者預先指定 | 可根據上下文自動挑選並呼叫合適的工具 |
記憶能力 | 僅限於上下文記憶 | 能追蹤狀態與中間結果,影響後續決策 |
執行流程 | 一次輸入 → 一次回應(線性流程) | 多步驟流程,支援條件判斷、循環與分支控制 |
適用情境 | 問答、摘要、翻譯、文字生成 | 多階段分析、自動化流程、資訊整合、決策建議等 |
根據前 OpenAI安全研究副總裁 Lilian Weng 在其文章 LLM-powered Autonomous Agents 的整理,一個完整的 AI Agent 系統,除了以 LLM 作為核心大腦外,還需要搭配以下幾個關鍵元件,才能真正具備自主規劃與行動能力:
規劃(Planning)
記憶(Memory)
工具使用(Tool Use)
當模型本身的知識不足或需要執行特定操作時,Agent 可以呼叫外部工具,例如:
這些元件相互搭配,使得 AI Agent 不再只是「被動輸入 → 被動輸出」的對話系統,而是具備長程記憶、任務分解能力,並能藉由外部工具突破模型本身限制,展現出更高的智能與靈活性。
圖片來源:LLM-powered Autonomous Agents
在實際應用中,不同的任務需求會對 Agent 的設計方式產生顯著影響。並不是所有 Agent 都需要同時具備「規劃」與「執行」的能力:有些場景只需要幫忙查資料,有些則需要能進行複雜推理與決策。以下介紹幾種常見的 Agent 模式,幫助你在面對不同場景時,選擇合適的設計思路。
ReAct 是由 Google Research 提出的一種經典 Agent 架構,名稱來自 推理(Reasoning) 與 行動(Acting) 的結合。這種類型的 Agent 會在任務過程中不斷重複以下三個步驟:
透過這樣的迴圈,ReAct Agent 可以逐步完成需要多階段思考的任務。例如:
這類 Agent 的特點是靈活,適合處理不確定性高的任務,但同時需要更精細的 prompt 設計與結果追蹤機制。
這種類型的 Agent 以 工具使用能力 為核心,不一定具備複雜的推理能力,而是專注於根據輸入自動呼叫正確的工具。典型案例包括:
這類 Agent 設計簡單,適合有明確「輸入 → 輸出」關係的場景。例如,當使用者輸入「台北明天會下雨嗎?」Agent 就會自動呼叫天氣 API 並回傳結果。
當任務過於龐大或複雜,單一 Agent 難以勝任,此時可以透過 多個具專長的 Agent 分工合作 來解決。以產業研究報告自動生成為例,可能包含:
這樣的設計就像一個 AI 團隊,各司其職,整體系統因此更具彈性與擴充性。
並非所有任務都適合全自動化處理,尤其在需要人工判斷的場景下,引入 Human-in-the-Loop(人機協作) 機制就顯得重要。這類 Agent 的特色是在關鍵節點暫停,請人類參與決策,例如:
這種模式通常透過 Breakpoint、UI Prompt、等待使用者回覆 等方式實現,讓系統保持靈活與可控性,更貼近實務需求。
Note:以上幾種模式並不是互相排斥的,在實務應用中往往會交叉運用。比如,一個 ReAct Agent 可能同時具備多種工具調用能力;在多 Agent 協作的流程中,也可能加入人工中斷點以確保品質與正確性。掌握這些常見模式,有助於我們依照不同需求,靈活設計出最合適的 Agent 架構。
今天我們正式進入 AI Agent 的主題,理解它如何從單純的問答模型進化為能自主規劃與執行任務的智慧代理:
AI Agent 的價值在於讓模型從「被動回答者」轉型為「主動任務執行者」。接下來我們將進一步透過 LangGraph,學習如何將這些概念實作成靈活可控的 Agent 流程。